由于长期机器人操作中的地图尺寸的增长,现有的同时定位和映射方法的可伸缩性受到限制。此外,处理此类地图进行本地化和计划任务会导致船上所需的计算资源增加。为了解决长期操作中记忆消耗的问题,我们开发了一种新型的实时SLAM算法,即Meslam,该算法基于神经场隐含的地图表示。它结合了提出的全球映射策略,包括神经网络分布和区域跟踪,以及外部进程系统。结果,该算法能够有效地训练多个代表不同地图区域的网络,并在大规模环境中准确地训练姿势。实验结果表明,所提出的方法的准确性与最新方法(平均为6.6 cm的TUM RGB-D序列)相当,并且优于基线,IMAP $^*$。此外,拟议的SLAM方法提供了最紧凑的地图,而没有细节变形(1.9 MB(1.9 MB)在最先进的大满贯方法中储存57 m $^3 $)。
translated by 谷歌翻译
Algorithms that involve both forecasting and optimization are at the core of solutions to many difficult real-world problems, such as in supply chains (inventory optimization), traffic, and in the transition towards carbon-free energy generation in battery/load/production scheduling in sustainable energy systems. Typically, in these scenarios we want to solve an optimization problem that depends on unknown future values, which therefore need to be forecast. As both forecasting and optimization are difficult problems in their own right, relatively few research has been done in this area. This paper presents the findings of the ``IEEE-CIS Technical Challenge on Predict+Optimize for Renewable Energy Scheduling," held in 2021. We present a comparison and evaluation of the seven highest-ranked solutions in the competition, to provide researchers with a benchmark problem and to establish the state of the art for this benchmark, with the aim to foster and facilitate research in this area. The competition used data from the Monash Microgrid, as well as weather data and energy market data. It then focused on two main challenges: forecasting renewable energy production and demand, and obtaining an optimal schedule for the activities (lectures) and on-site batteries that lead to the lowest cost of energy. The most accurate forecasts were obtained by gradient-boosted tree and random forest models, and optimization was mostly performed using mixed integer linear and quadratic programming. The winning method predicted different scenarios and optimized over all scenarios jointly using a sample average approximation method.
translated by 谷歌翻译
随着空域中无人驾驶汽车(无人机)的数量的增加,确保飞机不会碰撞对进一步的技术开发至关重要。在这项工作中,我们提出了一个新的无人机,在空中碰撞附近(UNMAC)安全量i)机身大小,ii)定位精度,iii)无人机速度/速度和iv)无线技术功能。基于UNMAC,我们证明可以通过使用UAV-TO-UAV(U2U)通信来降低UAV间的分离距离,而安全水平保持不变。此外,这项工作表明,下一代远程ID消息应包含其他信息(即,估计的本地化错误,对于某些应用程序,移动方向)。由于远程ID的频繁广播可以进一步降低分离距离,因此我们确定了5G NR Sidelink,Wi-Fi和蓝牙为U2U通信的合适候选者。
translated by 谷歌翻译
在拟议的研究中,我们描述了一种方法,可通过在摄像机和猛击管道之间实现中间层来提高具有多个相机的移动机器人的视觉猛击算法和有限的计算能力的方法。在此层中,图像是使用基于RESNET18的神经网络对机器人定位的适用性进行分类的。该网络接受了在Skolkovo科学技术学院(Skoltech)校园收集的六摄像机数据集培训。对于训练,我们使用与随后的同一相机(“良好”关键点或功能)成功匹配的图像和球形功能。结果表明,网络能够准确地确定Orb-Slam2的最佳图像,并在SLAM管道中实施拟议的方法可以显着增加SLAM算法可以定位的图像数量,并提高其整体鲁棒性,并提高其整体鲁棒性。视觉大满贯。与使用Orb提取器和在CPU操作时使用Orb提取器和功能匹配器相比,操作时间的实验表明,在GPU上运行时,提出的方法的速度至少要快6倍。该网络评估在识别具有大量“良好” ORB关键的图像时至少显示了90%的精度。提出的方法的使用允许通过从具有贫困流的相机切换来保持整个数据集的大量功能。
translated by 谷歌翻译
在这项研究中,我们提出了一种新型的视觉定位方法,以根据RGB摄像机的可视数据准确估计机器人在3D激光镜头内的六个自由度(6-DOF)姿势。使用基于先进的激光雷达的同时定位和映射(SLAM)算法,可获得3D地图,能够收集精确的稀疏图。将从相机图像中提取的功能与3D地图的点进行了比较,然后解决了几何优化问题,以实现精确的视觉定位。我们的方法允许使用配备昂贵激光雷达的侦察兵机器人一次 - 用于映射环境,并且仅使用RGB摄像头的多个操作机器人 - 执行任务任务,其本地化精度高于常见的基于相机的解决方案。该方法在Skolkovo科学技术研究所(Skoltech)收集的自定义数据集上进行了测试。在评估本地化准确性的过程中,我们设法达到了厘米级的准确性;中间翻译误差高达1.3厘米。仅使用相机实现的确切定位使使用自动移动机器人可以解决需要高度本地化精度的最复杂的任务。
translated by 谷歌翻译
这项工作提供了在人口统计学限制下的最佳分类函数的几种基本特征。在意识框架中,类似于经典的不受限制的分类案例,我们表明,在这种公平性约束下,最大化准确性等于解决相应的回归问题,然后在级别$ 1/2 $上进行阈值。我们将此结果扩展到线性分类分类度量(例如,$ {\ rm f} $ - 得分,AM度量,平衡准确性等),突出了回归问题在此框架中所起的基本作用。我们的结果利用了最近在人口统计学限制与多界限最佳运输公式之间建立了联系。从非正式的角度来看,我们的结果表明,通过解决公平回归问题的解决方案来代替标签的有条件期望,可以实现无约束的问题与公平问题之间的过渡。最后,利用我们的分析,我们证明了在两个敏感群体的情况下,意识和不认识的设置之间的等效性。
translated by 谷歌翻译
随着最近的研究进展,深度学习模型已成为实时电信应用程序中声学回声取消(AEC)的有吸引力的选择。由于声学回声是音频质量差的主要来源之一,因此提出了各种各样的深层模型。但是,对良好回声取消质量的重要但经常忽略的要求是麦克风和远端信号的同步。通常,使用基于互相关的经典算法实现,对齐模块是具有已知设计限制的单独功能块。在我们的工作中,我们提出了一个基于内置自我注意的对准的深度学习体系结构,该架构能够处理不结盟的输入,从而改善了回声取消性能,同时简化了通信管道。此外,我们表明我们的方法可以在AEC挑战数据集中的真实记录上进行困难的延迟估计案例实现重大改进。
translated by 谷歌翻译
自主场景的曝光和探索,尤其是在本地化或沟通有限的区域,对于在未知场景中寻找目标有用,仍然是计算机导航中的一个具有挑战性的问题。在这项工作中,我们提出了一种用于实时环境探索的新方法,其唯一的要求是一个视觉上相似的数据集,用于预训练,场景中足够的照明以及用于环境感应的机上前瞻性RGB摄像机。与现有方法相反,我们的方法只需要一个外观(图像)才能做出一个良好的战术决定,因此在非成长,恒定的时间内起作用。两个方向的预测以像素为特征,称为goto和lookat像素,包括我们方法的核心。这些像素通过以下方式编码建议的飞行指令:goto像素定义了代理应以一个距离单位移动的方向,而Lookat像素定义了相机应在下一步中指向的方向。这些飞行的指导像素经过优化,以揭示当前未开发的区域的最多数量。我们的方法提出了一种新型的基于深度学习的导航方法,能够解决此问题并在更复杂的设置中证明其能力,即计算能力有限。此外,我们提出了一种生成面向导航数据集的方法,从而可以使用RGB和深度图像对我们的方法有效培训。在模拟器中进行的测试,评估了稀疏像素的推断过程的协调,以及旨在揭示区域并降低目标距离的2D和3D测试飞行取得了令人鼓舞的结果。与最先进的算法的比较表明,我们的方法能够表现出色,在测量每个相机姿势的新体素,最小距离目标距离,所见表面素的百分比和计算时间指标。
translated by 谷歌翻译
语言模型既展示了定量的改进,又展示了新的定性功能,随着规模的增加。尽管它们具有潜在的变革性影响,但这些新能力的特征却很差。为了为未来的研究提供信息,为破坏性的新模型能力做准备,并改善社会有害的效果,至关重要的是,我们必须了解目前和近乎未来的能力和语言模型的局限性。为了应对这一挑战,我们介绍了超越模仿游戏基准(Big Bench)。 Big Bench目前由204个任务组成,由132家机构的442位作者贡献。任务主题是多样的,从语言学,儿童发展,数学,常识性推理,生物学,物理学,社会偏见,软件开发等等。 Big-Bench专注于被认为超出当前语言模型的功能的任务。我们评估了OpenAI的GPT型号,Google内部密集变压器体系结构和大型基础上的开关稀疏变压器的行为,跨越了数百万到数十亿个参数。此外,一个人类专家评估者团队执行了所有任务,以提供强大的基准。研究结果包括:模型性能和校准都随规模改善,但绝对的术语(以及与评估者的性能相比);在模型类中的性能非常相似,尽管带有稀疏性。逐渐和预测的任务通常涉及大量知识或记忆成分,而在临界规模上表现出“突破性”行为的任务通常涉及多个步骤或组成部分或脆性指标;社交偏见通常会随着含糊不清的环境而随着规模而增加,但这可以通过提示来改善。
translated by 谷歌翻译
这项工作研究了凸和Lipschitz功能的在线零级优化。我们基于两个函数评估和$ \ ell_1 $ -sphere的随机化提出了一个新颖的梯度估计器。考虑到可行的集合和Lipschitz假设的不同几何形状,我们分析了在线双重平均算法的算法,代替了通常的梯度。我们考虑对零级甲骨文噪声的两种假设:取消噪声和对抗性噪声。我们提供任何时间和完全数据驱动的算法,它适应问题的所有参数。在文献中先前研究过的噪声的情况下,我们的保证可以比Duchi等人获得的最新界限可比性或更好。 (2015)和Shamir(2017)非自适应算法。我们的分析是基于在$ \ ell_1 $ -sphere上带有显式常数的均匀度量的新加权的Poincar \'e类型不等式,这可能具有独立的利益。
translated by 谷歌翻译